人工智慧時代,一個自我實現的預言 (中)
上回我們講到現在的人工智慧,最重要的價值就是越來越能提供廉價且準確的「預測」。在《AI經濟的策略思維》一書中,作者強調:預測就是情報,是以已經掌握的資訊,來創造還未掌握的資訊,填補缺失的環節,而這就是人類智慧的關鍵。
想像一下,你現在回到幾十萬年前,成為智人的老祖宗,你一個人直立行走在草叢中,突然看見不遠處有一叢草枝擺的幅度比較大,在這一瞬間,你馬上判斷這搖擺的方式不是風吹,而是動物在動,甚至還判斷出動物的大小跟可能是什麼動物,於是要嘛你拔腿就跑,要嘛找尋周遭有無石頭好防身,代表你已經藉由察覺環境中出現的模式,推斷出草叢後可能的危險。
但要是你這位老祖宗看到這樣的情形,卻待在原地思考要用什麼科學方法來調查草叢搖擺的原因,甚至滿懷好奇心地撥開草叢,想直接目睹,你極有可能成了猛獸的餐點,沒機會把你那充滿好奇的基因跟思維方式傳下來。
雖然這樣的預測其實就是腦補,而且我們都知道到了現在,我們這種腦補的 #捷思 已經成了一個大問題,讓我們很容易被有心人刻意產出、安排的資訊陷阱(例如假新聞)給矇騙,但我們還是得感謝我們的老祖宗愛腦補,不然也輪不到我們現在擔心這些問題,早就被淘汰了。
在機器學習出現之前,我們主要是用統計方法中的多變數迴歸分析 (multivariate regression) 來有效率地降低預測錯誤。這種方式可以在數據比較少,而且可以判斷 #大概是哪些條件對預測有幫助 的時候。
什麼是迴歸分析:
https://zh.wikipedia.org/wiki/%E8%BF%B4%E6%AD%B8%E5%88%86%E6%9E%90
多元線性回歸分析預測法
https://wiki.mbalib.com/zh-tw/%E5%A4%9A%E5%85%83%E7%BA%BF%E6%80%A7%E5%9B%9E%E5%BD%92%E5%88%86%E6%9E%90%E9%A2%84%E6%B5%8B%E6%B3%95
例如,假設我們要預測一家電信公司的 #顧客流失率,你覺得要注意哪些條件呢?一個最主要的觀察重點,就是用戶用 #手機上網的時間跟消耗的流量,畢竟如果他們都沒在用,就可能會把帳戶停了。
但機器學習就不是這樣子,不需要跟迴歸分析一樣,先確定條件,而是讓機器自己從大量資料中辨識出特徵或模式,例如同樣要預估電信公司的顧客流失率,你就可以建立模型,然後把每分鐘的通話、簡訊或上網紀錄、帳單金額、準時付款與否、甚至每天數百萬使用者的地點等各種資料都交給人工智慧去學習、並找出模式。變數可能有好幾千個。
例如你可能會發現,在每個月前幾天就花很多時間講電話的顧客,比起帳單金額高,但都在每個月最後幾天講電話的人,比較不會流失。或是在每天 9-17 點常用電話的人,比起少用電話的人,更容易流失。這些都很難一開始就預測到,但機器學習可以透過 #資料探勘 (Data mining),找到從我們眼角溜過的那些蛛絲馬跡。
有了好的預測,會大大的影響決策。就像上篇中的一張圖表示的。舉例來說,棒球教練會根據對方打者的擊球模式、過往的打擊數據(也就是 #輸入)判斷這個打者可能會打出安打,或是內野滾地球被接殺,這就是 #預測。
接著教練得做出怎麼安排野手的守備位置比較好的 #判斷。
如果往外野退,但打者打出內野犧牲打、讓隊友盜壘怎麼辦,如果往內野縮,那就可能會讓外野安打失分更多,又該怎麼辦?權衡之後,教練就得發出指令,這就是 #行動。
接著就是看打者到底會被三振、還是擊出安打、還是被接殺...最後的結果也將以 #數據化的形式,成為訓練預測跟判斷的 #資料。
同樣的,醫生會根據我們的症狀找出模式,來對症下藥。股市交易員會針對指數的升降,找出模式,然後加以預判,看是要買進或賣出。
我們也會根據走路姿態,甚至腳步聲,認出從走廊走過來的是誰,決定要不要跳出來嚇她(誤)或跟咬著吐司與她互撞來交換靈魂(無誤)。
我們人類所做的事情都跟預測有關,但也都不只是預測,因此各位可以想想,如何「拆解」一件事情,變成很多個細節小任務,然後去想:這許多小任務中,有哪些其實就是在「預測」?那麼,如果要讓人工智慧來代替這個預測的環節,我們需要哪些資料來訓練呢?
相較於人類的預測,機器的預測可以規模化,每次預測的單位成本會越來越低,而且速度將漸漸比人類更快、更好。這是很有競爭力的一點。但有兩個挑戰:
第一:就目前以及可預見的近未來來看,人類的認知模式還是比人工智慧更能了解真實世界的運作,我們的感官跟大腦讓我們能夠用很少量的數據就做出預測。所以,在非典型事件、資料量較少的情況下,人類預測的正確率還是遠超過機器預測的。
第二:雖然預測的成本低了,但判斷跟行動的代價還是很高,這時候最好的方式就是結合人類跟機器。並且讓機器去學習「#人類在這種情況下會怎麼做?」
舉例來說,現在 Google 等公司提供的翻譯就是一種預測,他們透過深度學習,對一篇英文文章提出機器所能得出的中文版本,通常會提出好幾個版本讓我們去挑選,我們可以省下一個字一個字自己去全文翻譯,或是請人翻譯。
如果機器預測的品質,也就是翻譯的結果太差,我們就會放棄。但如果品質不錯,我們挑了一個版本之後,可以自己簡單調整修飾,看是要改成口語一點還是嚴謹一點,就可以省下不少時間。透過人與機器的搭配,決策跟行動都可以更有效率。
自駕車也是一樣。除了讓電腦不斷提升辨識路況、號誌、各種物件、各類訊號的精準度以外,先當個副駕駛,學會人到底是怎麼開車的、在不同的情況下會怎麼做,其實更是關鍵。
在我想好下篇該寫什麼之前,大家不妨可以分享一下你的看法:你在日常生活中已經感受到哪些「預測平價化」帶來的改變呢?
上集請見:
Medium https://medium.com/%E9%84%AD%E9%BE%9C%E7%85%AE%E7%A2%97%E9%BA%B5/%E4%BA%BA%E5%B7%A5%E6%99%BA%E6%85%A7%E6%99%82%E4%BB%A3-%E4%B8%80%E5%80%8B%E8%87%AA%E6%88%91%E5%AF%A6%E7%8F%BE%E7%9A%84%E9%A0%90%E8%A8%80-%E4%B8%8A-f7f344e8be0
FB:
https://www.facebook.com/noodleswithturtle/posts/570211210140916
再推薦一次好書:
《AI經濟的策略思維》
https://www.books.com.tw/products/0010803316
想上我跟洪智傑老師開的的 AI 入門課,請到這裡:
https://panschool.asia/product/人工智慧必修課
同時也有10000部Youtube影片,追蹤數超過2,910的網紅コバにゃんチャンネル,也在其Youtube影片中提到,...
「data mining中文」的推薦目錄:
- 關於data mining中文 在 鄭龜煮碗麵 Facebook 的最佳貼文
- 關於data mining中文 在 軟體開發學習資訊分享 Facebook 的最讚貼文
- 關於data mining中文 在 Mina 安米娜 Facebook 的最佳貼文
- 關於data mining中文 在 コバにゃんチャンネル Youtube 的最讚貼文
- 關於data mining中文 在 大象中醫 Youtube 的精選貼文
- 關於data mining中文 在 大象中醫 Youtube 的最讚貼文
- 關於data mining中文 在 Data mining 中文: 國泰台灣5g ptt 的評價
- 關於data mining中文 在 欢迎来到《Data Mining》中文版 的評價
- 關於data mining中文 在 Data Mining 數據挖掘行為預測關係鏈接零售化妝品 - YouTube 的評價
data mining中文 在 軟體開發學習資訊分享 Facebook 的最讚貼文
課程名稱 - Python 3 資料科學入門與實戰 https://goo.gl/NEPru6
本課程是 Python Data Science 的入門課程,是學習 Python 在 Text Mining,Machine learning,deep learning 中應用的基礎。
>詳細課程介紹請參考 https://goo.gl/NEPru6
>觀看更多課程介紹短片 https://goo.gl/AXvm2Z
data mining中文 在 Mina 安米娜 Facebook 的最佳貼文
請HR不要再問奇怪的問題了!!!我會攻擊你們喔
EX.你有沒有男友、你為什麼有XX證照
台北多間面試心得,以下幾家供「統計新鮮人」參考
(1)品質管理軟體:客服工程師(被找上)
工作內容:學會軟體操作後到各家廠商去教學,我小時候夢想是當老師,所以一聽到可以在很多人面前授課就覺得非常心動
面試前會先做考題,邏輯、英文、給企管或品管的專有名詞英文縮寫叫你用中文解釋,三個人一起面試,輪流上台講解統計給非相關背景的人,還用攝影機側錄
結果:拿到offer後才知道薪水才33k,理由竟然是我是女生,懷孕期間會對公司沒有生產力,蠻有趣的
(2)美商軟體:QA工程師(被找上)
工作內容:就是測試APP,研發部在美國跟台灣,設計出的金融APP在大陸地區使用,還願意教我這個非相關背景的人寫APP我覺得很感動
結果:一樣是薪水太低,理由是我非本科系
(3)美商顧問:資料分析
工作內容:整理資料作分析,定期與大陸同事開會,針對行銷重點做報告
面試過程非常輕鬆,面試主管人很nice 完全沒有要電人的意思,考一些國際產業別的東西,就算我回答不好也很有耐心地跟我講解答,之後考程式(筆試非上機考)1.5小時,我覺得蠻難的,但好險有低分通過
結果:第二次面試我講話失言,事後有寫道歉email,無聲卡
(3)金融:資料分析師
工作內容:使用SAS與SQL對客戶貸款資料做描述性分析,有獨立server,代表資料會跑很快(非常好),還可以到國外出差做技術教學
面試用英文自我介紹、憑什麼要錄用你、解釋之前參加比賽所使用的金融模型,之後都在閒聊,面試官是兩位女生還關心我的休閒活動與之後出差後我們可以去哪裡玩之類的,總之非常的愉快
結果:通知我第二次面試時,我已經去某一家公司報到(百感交集)
(4)南港軟體業:資料分析
面試時問我會不會寫JAVA或是R,我回答略懂,他說該職缺整理資料佔90%,資料分析只有10%
結果:感謝函
(5)外商生技產業:業務(被找上)
電話面試中我有說其實我比較擅長資料分析,很希望可以進貴公司之類的,HR說會把我的履歷轉到生統部門
結果:無聲卡
(6)製造代工業:PM
工作內容:常駐大陸,可以去資料分析部門當助理,因為要進他們資料分析要名校博士起跳,我不夠格
三次電話面試,(A)事業群主管聊人格特質,(B)資料分析部門問專業性,遺失值該怎麼處理、資料分布型態有哪些、如何得知自己Data Mining的accuracy、面對找不到適切的MODEL該怎麼做,(C)瞎聊我也忘了,我有點精疲力盡
未完待續.....大家晚安^^
data mining中文 在 コバにゃんチャンネル Youtube 的最讚貼文
data mining中文 在 大象中醫 Youtube 的精選貼文
data mining中文 在 大象中醫 Youtube 的最讚貼文
data mining中文 在 欢迎来到《Data Mining》中文版 的推薦與評價
欢迎来到《Data Mining》中文版. Data Mining,本书由Charu C.Aggarwal所著,出版于2015年4月14日。豆瓣无评分,亚马逊评分4星(5星满分),从CSDN社区一些讨论情况来 ... ... <看更多>
data mining中文 在 Data mining 中文: 國泰台灣5g ptt 的推薦與評價
資料探勘(英語:data mining)是一個跨學科的電腦科學分支。 它是用人工智慧、機器學習、統計學和資料庫的交叉方法在相對較大型的資料集中發現模式的 ... ... <看更多>